查看原文
其他

冯全功、崔启亮:译后编辑研究: 焦点透析与发展趋势

上海翻译 大民说英语 2021-09-15


摘要: 译后编辑是指根据一定的目的对机器翻译的原始产出进行加工与修改的过程,它已发展成为全球语言服务行业的新兴职业。国内外译后编辑研究迄今多集中在译后编辑概述、译后编辑评估研究、机器翻译错误识别与译后编辑工具研发、译后编辑研究的行业视角、译后编辑能力与译后编辑者的培养等话题上。此研究的发展趋势包括集成翻译工作环境的研发、特定机器翻译系统的研制与应用、译后编辑人才的培养、产学研的深入合作等。

 

关键词: 译后编辑; 机器翻译; 焦点透析; 发展趋势

 

一、引言

 

在全球化与信息化时代,国际间的信息流动日益迅速与频繁,各种形式的翻译是海量信息畅通流动的根本前提,也是全球语言服务行业的核心业务。机器翻译的译后编辑(machine translation post-editing or post-editing of machine translation)便在这种背景下得到学界与业界的广泛关注。所谓译后编辑(post-editing or post-editing,PE for short)是指根据一定的目的对机器翻译的原始产出进行加工与修改的过程,包括更改翻译(语言)错误、提高机译产出的准确性与可读性等。其中,编辑加工的程度由多种因素而定,如翻译目的、客户需求、客户报价、文档类型、机译产出质量、文档使用寿命等。(冯全功,张慧玉,2015: 66)译后编辑在全球语言服务行业内有广泛的应用,SDL,Microsoft等知名公司都拥有自己的译后编辑团队,由几十人或数百人组成,其它知名的语言服务供应商也大多提供译后编辑服务。2012年欧洲语言行业协会(European Language Industry Association,ELIA)对本协会公司会员的专题调研表明,42.0%的公司处理涉及译后编辑的项目,22.2%的公司拥有经过特殊培训的译后编辑人员,72.0%的公司从客户方接收机译产出以供译后编辑,57.1%的公司认为译后编辑对自己的公司而言是一个具有很大潜力的商业机遇。(Bajon et al,2012)由卡门森斯咨询公司(Common Sense Adversary)提供的“2016 语言服务市场”报告显示,2016年机器翻译的译后编辑业务占整个语言服务行业市场的3.94%,其中25.39%的语言服务供应商提供译后编辑服务,并且认为该项服务前途光明(a promising future),同时发布了“译后编辑进入主流”(Post-Editing Goes Mainstream)的调研报告。翻译自动化用户协会(Translation Automation User Society,TAUS)以及SDL等机构也开始提供译后编辑培训与认证服务。随着机器翻译技术的改善、翻译量的激增以及人力成本的增大,译后编辑在语言服务行业内将会发挥越来越重要的作用,也会引起翻译教育界的高度重视。

 

译后编辑是机器翻译与翻译研究领域共同关注的话题,前者主要关注技术(工具)的研发,如智能译后编辑器、译后编辑对改良机器翻译技术(引擎)的反馈作用等; 后者主要关注译后编辑的应用,如译后编辑评估、译后编辑者的培养等。一般而言,译后编辑技术领域的专家对翻译实践了解较少,翻译领域的专家对翻译技术了解不深,两张皮的现象较为严重。但也有例外,如同济大学外国语学院的李梅近年来致力于译后编辑的自动化处理,偏向于技术,也取得了较大的成绩,(李梅,朱锡明,2013a; 李梅,朱锡明,2013b)并两度以“译后编辑”为课题申请到教育部人文社会科学研究规划基金资助。相对而言,国外的译后编辑研究与语言服务行业的结合更为紧密,起步也比国内早20年左右(翻译研究领域) ,并出现了一些标志性的成果,如Hans. Krings(2001)的专著Repairing Texts: Empirical Investigations of Machine Translation Post-editing ProcessesAna Nio(2010)的专著Translation versus Machine Translation Post-editing,Sharon O’Brien(2014)等主编的论文集Post-Editing of Machine Translation:Processes and Applications等。国内的译后编辑研究相对滞后,仅零星出现了一些论文,研究还有待深入拓展。本研究旨在通过聚焦译后编辑的主要研究对象,重点分析其在翻译界的研究现状,同时结合语言服务行业的发展与高校翻译教育的转型,总结出译后编辑研究的若干发展趋势,以供学界参考。

 

二、译后编辑研究的焦点透析

 

译后编辑研究既有高度综合的(如对译后编辑的总体介绍),又有相对专业化的(如译后编辑认知负荷研究),不同的研究具有不同的焦点。常见焦点包括译后编辑概述、译后编辑原则与实践、译后编辑质量与效率评估、译后编辑对机器翻译的反馈、译后编辑工具研发与应用、译后编辑在行业中的应用、译后编辑能力与译后编辑者的培养等。

 

(一) 译后编辑概述

 

译后编辑概述属于宏观研究,话题具有较强的包容性与普遍性。Jeffrey Allen(2012)的文章介绍了译后编辑的定义、谁为译后编辑者、使用机器翻译与译后编辑的原因、译后编辑的类型与程度、译后编辑的原则与标准、半自动译后编辑处理等。Allen把译后编辑分为内向型翻译途径(inbound translation approach)与外向型翻译途径(outbound translation approach),前者有时被称为吸收型机器翻译(MT for acquisition or assimilation),旨在理解信息,后者则被称为扩散型机器翻译(MT for dissemination),旨在交流信息。内向型翻译途径可分为没有译后编辑(也称浏览或概要)与快速译后编辑,外向型翻译途径可分为没有译后编辑、最小程度的译后编辑、充分译后编辑。Allen对译后编辑程度的分类稍显凌乱,尤其是术语方面,其他学者也有类似的倾向。Sharon OBrien在题为Introduction to Post-Editing: Who,What,How and Where to NextPPT发言中也提到译后编辑的程度问题,其中的一组术语为轻度译后编辑(light post-editing)与充分译后编辑(full post-editing)。笔者较为赞同这一组术语,认为两者之间是一种连续体的关系,并且基本上与内向型机器翻译和外向型机器翻译相对应。崔启亮(2014:69)把对直接通过机器翻译得到的译文进行译后编辑的行为称为“狭义的译后编辑”或“机器翻译的译后编辑”,把对翻译记忆、机器翻译和翻译管理系统集成翻译环境下得到的译文进行译后编辑的行为称为“广义的译后编辑”或者“集成翻译的译后编辑”。这种分类比较新颖,也颇符合当下业内实际,尤其是集成翻译环境下的译后编辑代表着语言服务企业中技术应用的新趋势。

 

崔启亮(2014)还对译后编辑的发展动力、译后编辑的应用领域、译后编辑的实践准则进行了分析。其中的实践准则颇值得一提,包括根据译文质量要求,确立译后编辑风格指南; 根据机器翻译系统类型,识别机器翻译输出的错误特征; 根据译后编辑的目的,确定译后编辑工作环境; 将训练有素的机器翻译系统与职业的译后编辑人员相结合; 根据质量目标和人员技能,合理设定译后编辑工作量。崔启亮的实践准则相对宏观,业界(学界)还总结出了一些具体的操作原则,如TAUS原则: 1) 追求语义正确的翻译; 2) 保证信息未被意外地增删; 3) 编辑任何具有攻击性、不合理或文化上不可接受的内容; 4) 尽可能多地使用原始机译产出; 5) 遵循基本的拼写原则; 6) 没有必要在风格方面进行更改; 7) 没有必要仅仅为了提高文本的流畅性重组句子。(ACCEPT,2012: 5)Midori Tatsumi(2010: 231)也表达了相似的观点,即正确传达原文的意义,符合目的语语法,具有较强的可理解性,不必考虑译文的美学或风格问题等。译后编辑的基本原则可概括为用最少的编辑量与可理解的语言使机器译文具有正确的意义。(LDC,2012: 20)译后编辑的具体原则不能一概而论,要视具体情况而定,如译后编辑的目的与程度(内向型或外向型,轻度编辑或充分编辑),译后编辑者的语种类别(双语或单语)以及具体的语言对,机器翻译系统的性质与性能等。所以译后编辑原则应该是一个动态的构成,而不是静态的描述,具有较强 的 语 境 依 赖 性。Celia Rico & Martin Ariano(2014)设计的有关译后编辑的“灵活决策工具”(flexible decision tool)就很好地体现了这一点,其中包括对某一具体语言对(如英法)的译后编辑原则进行激活以及决定需要使用的基于具体语言对的译后编辑原则(从所有给定原则中进行选择)等。除了译后编辑的分类与原则(准则)之外,此类概述文章还包括很多其它话题,此不赘述。

 

(二) 译后编辑评估研究

 

译后编辑评估研究指对译后编辑的质量、效率、价值、意义、所耗时间、认知负荷等方面进行评估的研究,实证与对比的模式最为常见。此类研究也是笔者所搜集的论文中出现频次最高的。Linda Mitchell et al(2014)提出了评估社区译后编辑质量的三种方法,即由受训语言学家完成的错误注解,由行业专家完成的流畅性与忠实性评估以及由社区成员完成的流畅性评估,通过实验讨论了相关结果并指出了由社区成员进行评估的可行性。Ana G.Arenas(2014)通过实验发现处理机器翻译句段与处理由翻译记忆产生的85-94%的模糊匹配所耗的时间基本没有区别,但两者的速度要比没有匹配(匹配包括机译产出)高很多,得出使用翻译记忆与机器翻译建议文本(译文)可帮助译者提高工作效率的结论。然而,Ana G.Arenas(2008)之前却发现译者编辑机译产出要比处理翻译记忆的模糊匹配(80-90%)具有更好的效率与质量。由于受试群体、评估方式、翻译记忆与机译系统、翻译记忆模糊匹配值域的选择等方面的差异,前后得出的结果不同也在情理之中。Arenas的对比研究,尤其是翻译记忆的模糊匹配与机器翻译的译后编辑的对比,颇有意义与价值。还有一些研究译后编辑与人工翻译效率对比的,得出的结果一般都是两者可以产出相似的质量,但译后编辑的效率更高(有时质量甚至也更高),如Mirko Plitt&Franois Masselot (2010),Spence Green et al (2013),Anne M.Turner et al(2014)等。此类研究基本上都是实证性的,但很难精确量化,所得的结果往往大同小异,以后不妨在评价角度与评估模型等方面多加努力。

 

若对译文质量较差的机译产出进行译后编辑,所耗时间与精力也许比完全人工翻译更多,质量也可能会更差,所以评估机译产出的质量是否值得进行译后编辑,发现减少译后编辑所耗精力的途径也是重要的研究领域(Koponen,2012: 181)。Lucia Specia & Atefeh Farzindar(2010)描述了一种基于能够反映翻译原语句子困难以及原语与译语句子之间差异特征的HTER(Human-targeted Translation Edit Rate)来评估译后编辑所耗精力的方法,这种途径要比用句子长度等简单标准来过滤低质机译产出可靠得多。Lucia Specia(2011)通过三种人为注释模型(译后编辑时间、距离与所耗精力值)来测量译后编辑所耗的精力,发现时间能相对可靠地反映出译后编辑所耗的精力。Irina Temnikova(2010)还进行了一种较新的译后编辑评估实验,即通过使用与不使用受控语言(controlled language)之间的对比,证明了使用受控语言可以提高机译产出的质量与译后编辑的效率。使用受控语言对原文进行译前编辑或直接用受控语言进行原文写作可以有效地提高机器翻译的准确性,这也是译后编辑研究的重要话题,值得深入研究。此外,还有评估译后编辑所带来的商业利益的、研究译后编辑所耗认知努力测量指标的、预测译后编辑效率的、测评各类译后编辑工具的、研究协同翻译环境下影响译后编辑效率因素的、探索原文特征与译后编辑所耗时间与技术精力之间关系的、研究译者的职业经验对译后编辑效率影响的、研究译后编辑中的停顿与认知努力之间关系的,等等。Sharon O’Brien等主编的论文集Post-Editing of Machine Translation: Processes and Applications(共14篇),涉及相关评估的就多达9篇,其中Alan K.Melby等还提出了译后编辑评估“形式化与结构化翻译要求”的途径(张慧玉,冯全功,2016)。国内译后编辑研究相对落后(多为介绍性与应用性),还未出现专门的译后编辑评估研究。

 

(三) 机器翻译错误识别与译后编辑工具研发

 

机器翻译错误识别可以为专门的译后编辑工具研发提供依据。Débora B.de J.Martins & Helenade M.Caseli(2015)描述了一个自动识别机译错误的实验,这些错误是由一流的基于短语的统计型机译系统所产生,并且真正需要进行译后编辑的错误,以避免不必要的自动化的译后编辑以及由此产生的新错误。罗季美、李梅(2012)对机器译文与人工译文进行了对比研究,描述了机器翻译在词汇、句法、符号等方面表现出的典型错误形式,并通过补充建立形式化规则为机器翻译系统提供反馈。李梅、朱锡明(2013b)还设想对这些出现频率高的典型机译错误进行二次加工,即进行自动化处理以过滤掉这些典型错误,从而减少译后编辑者的工作量。崔启亮、李闻(2015)基于科技文本(英译汉)探讨了机器翻译的错误类型,如欠译、过译、漏译、术语翻译错误、形式与格式错误、短语顺序错误等。

 

Kristen Parton et al(2012)描述了一些针对充分性错误的自动译后编辑器(Automatic Post-editors,APEs),并通过实验表明其可相对显著地提高译文的充分性(adequacy),与原始机译产出相比,30-56%自动编辑过的句子充分性有所提高。Wilker Aziz et al(2012)描述了一种独立的译后编辑工具(PET),既有助于对任何机译系统的产出进行译后编辑,也可搜集译后编辑过程中句子层面的信息,如译后编辑的时间与详细的按键统计等。Asheesh Gulati et al(2015)介绍了一种以使用者为中心专供教学使用的在线机器翻译平台(ACCEPT Academic Portal),包括译前编辑、翻译与译后编辑三大模块。可见国外的译后编辑工具研发已深入到教学领域,而国内翻译界对此还十分陌生。黄河燕、陈肇雄(1995)提出过一种以意段为基本处理单位的智能译后编辑器的设计,以提高译后编辑的效率。韩培新(1996)对智能译后编辑器(IPE)进行了研究,包括总体结构、功能设计、主要算法等。黄河燕、陈肇雄(2004)提出了基于多策略的交互式智能辅助翻译平台的设计,其中包括智能化的译后编辑修改机制,如多窗口同步跟踪技术、智能词缀、智能跟踪记忆技术等。译后编辑工具的研发国内外都取得了一定的成绩,尤其是机器翻译领域,但只有对之加以(免费)推广或实现商业化,才能有助于译后编辑的应用与发展。

 

(四) 译后编辑研究的行业视角

 

此类研究主要是从语言服务行业来审视译后编辑的,作者大多为行 业内从业人员。Lori Thicke(2013)指出机器翻译(包括译后编辑)可通过提供高效率、快产出、低成本与高质量的服务起到革新行业的作用,但目前行业内部严重匮乏译后编辑者,作者分析了其中的原因(公司与个人原因),并提出了几条建议,包括选择与训练合适的引擎、让译后编辑人员快速地改善引擎、对译后编辑者进行培训等。Ana G.Arenas(2013)通过问卷调查及访问对职业译者对译后编辑的态度进行了调查,发现他们对之有着复杂的经历与情感,这并不是因为他们对译后编辑了解甚少或不愿意把其纳入本地化过程,而是由于以前经历过的各种机译产出的质量以及该类项目的特点所致。Arenas得出的结论与Thicke的观点(译后编辑者匮乏的原因)不谋而合。然而,Arenas的受试范围较小(24个译者加上3个审校),结论的有效性还有待进一步调查验证。Luciana C.Ramos(2010)从语言服务供应商的角度探讨了机器翻译(译后编辑)在翻译与本地化中的实际应用,包括内容与机译系统的相互适应、译后编辑者的角色、对Google Translator Toolkit的介绍与应用等,认为把机器翻译(译后编辑)加入到整个工作流程中具有不可否认的优势,尤其是大宗内容的翻译,可望提升翻译企业的生产效率。Adriana Beaton & Gabriela Contreras(2010)对Continental AirlinesSDL两家公司的译后编辑实践进行了介绍,分析了其中的挑战与收益。Ventsislav Zhechev (2014)介绍了Autodesk公司机器翻译的译后编辑,聚焦于英语与其它十三种语言的组合以及各种语言对所提高的效率。欧洲语言行业协会从语言服务供应商视角对译后编辑也进行过详细介绍。还有一些大型语言服务提供商,如Lionbridge,CSOFT,Moravia等,也认为译后编辑是机器翻译成功的关键,在语言服务行业中大有用武之地。

 

(五) 译后编辑能力与译后编辑者的培养

 

译后编辑能力研究一般是为译后编辑者的培养(译后编辑教学) 服务的,国内外还罕见单独的研究,大多是附带的论述。Sharon O’Brien(2002)认为除一些公认能力之外(如原语与目的语能力、专业领域知识、工具运用能力等),成功的译后编辑者还需掌握机器翻译知识、术语管理技能、译前编辑/受控语言技能、基本的编程技能、语篇语言学技能,并能运用宏命令,为机器翻译编制字典,对机器翻译抱有积极的态度等,并对译后编辑课程的模块进行了勾勒(分理论和实践两大模块)。Celia Rico & Enrique Torrejón(2012: 169-170)认为译后编辑需要三大范畴的能力,即语言能力、工具能力与核心能力,其中语言能力包括至少两种语言和文化的交际与语篇能力、文化与跨文化能力、主题领域知识(能力),工具能力包括术语管理、词典维护、基本编程能力和机器翻译知识(包含对机器翻译产出的容忍与积极态度),核心能力包括态度或生理/心理能力、策略能力。需要说明的是,态度或心理/心理能力主要指如何处理译后编辑过程中的主体性问题,如制定与应用译后编辑细则、对顾客期望(译文质量)的充分满足、克服不确定性、容忍低质译文等;策略能力主要指对译后编辑程度的精明决策、对译后编辑指南的严格遵循与对风格问题的果断舍弃(即使面对低质机译产出)等。Masaru Yamada(2015)鉴于业内还相对匮乏译后编辑者,提出了把高校语言学习者作为潜在的译后编辑者的方案,并对之进行了实验,尤其是他们的译后编辑素质与相应的表现,发现翻译时采取分析而非整合途径(初学翻译者往往如此)的A类学生(平时成绩突出者)更适合从事译后编辑。Ilse Depraetere(2010)基于一项个案研究针对在高校如何进行译后编辑培训提出了一些有用的建议,如分析机译产出错误、遵循译后编辑原则等。冯全功、张慧玉(2015)从译后编辑的行业需求、译后编辑能力、译后编辑课程设置、译后编辑教学及译后编辑工具选择等方面探讨了译后编辑者的培养途径,并呼吁在高校单独开设译后编辑课程,或者把译后编辑模块融入到计算机辅助翻译课程之中。译后编辑能力与教学方面的研究还相对较少,还有待深入探索。

 

(六) 其它相关研究

 

译后编辑其它相关话题的研究虽然不是译后编辑的主流研究,但也出现了很多颇有意义的成果。用译后编辑结果改善或评价机译系统的研究较为常见,如Fujio Nishida & Shinobu Takamatsu(1990),Wilker Aziz et al(2013)等。Johann Roturier et al(2013)介绍了社区译后编辑在线环境(ACCEPT工作环境,在此环境下任何译后编辑行为都可被记录与储存),并验证了该环境的可及功能与可使用性。Muriel Vasconcellos(1987)对翻译审校(translational revision)与译后编辑的区别与联系进行了细致研究,指出前者主要是一种发现(如翻译错误)过程,后者则是一种不断调整(机译错误)的过程。Ana Nio(2004)探讨了把机器翻译的译后编辑作为提高外语写作技能教学手段的潜能,视角新颖,潜力很大,可谓译后编辑的独特应用。2010年,Nio发表的专著Translation versus Machine Translation Post-ed-iting探讨的主要也是译后编辑在外语写作中的应用,体现了研究的延续性。此外,还有研究译后编辑策略与具体过程的; 从译后编辑视角概述翻译工具的; 研究译后编辑如何成就单语译者的; 研究译后编辑的目的语为母语或外语时是否能够取得类似译文质量的; 研究译后编辑为逆向翻译(目的语为译者的弱势语言)所带来利益的; 研究译后编辑表现与翻译经验之间相关性的; 研究译后编辑在翻译新技术或模式(如云翻译、众包翻译等)中地位与作用的; 研究译前编辑 + 机器翻译与机器翻译 + 译后编辑两种模式之间差异的; 研究翻译建议框架如何提升译后编辑体验的; 研究受控语言写作(受控翻译)与译后编辑的等等。相信随着译后编辑研究的深入与拓展,将来会涌现出更多新的焦点话题。

 

三、译后编辑研究的发展趋势

 

译后编辑是提高机器翻译质量的重要途径,也是实现人机交互翻译的重要表现,可望成为语言服务行业新的业务增长点,译后编辑本身也有望成为一种独立的职业。随着市场需求的增加与机器翻译技术的完善,不管是在企业还是在高校,译后编辑将会受到越来越多的关注。结合国内外译后编辑应用与研究现状、翻译技术的快速发展以及翻译教育理念的转变等因素,针对译后编辑研究与应用可总结出以下发展趋势

 

(一) 集成翻译工作环境

 

随着各种翻译技术的整合应用,译后编辑实践的运行环境将朝集成化方向发展,这也是崔启亮(2014: 69)所谓的“集成翻译的译后编辑”或“广义的译后编辑”。这里体现“集成”最重要的一个方面便是机器翻译结合了翻译记忆系统,或者说翻译记忆软件中装置(外接)了机器翻译系统,这种集成模式被称为“TM + MT技术”或“MTM(机器翻译 + 翻译记忆)”(王华树,2013)。当然,这种集成模式也少不了译后编辑的参与,故有些学者还称其为“MTM + PE(机器翻译 + 翻译记忆 + 译后编辑)”(崔启亮,2014)或“MT + CAT + PE(机器翻译 + 机辅工具 + 译后编辑)”(徐彬,郭红梅,2015)。目前,很多计算机辅助翻译软件(翻译记忆为其核心功能)也基本实现了两者的结合,如 Trados,Wordfast等,但这些平台似乎不太适合进行专业的译后编辑实践。能够进行专业译后编辑实践的系统(软件),翻译记忆功能似乎又没那么强大,尤其是模糊匹配。如何实现机器翻译(译后编辑)与翻译记忆的有机融合,充分发挥两者的作用,构建一个集成化的友好翻译平台,是技术专家需要考虑与解决的问题。在这种集成环境下对需要进行译后编辑的翻译记忆模糊匹配值域的设定也是需要慎重考虑的,需要通过反复实验确定在一个合理的范围。因为如果模糊匹配值设置过低(如60%左右),对翻译记忆产生的译文进行译后编辑可能会比直接用机器译文更加消耗时间与精力,如果设置过高(如95%左右),则不能充分发挥翻译记忆的优势。

 

集成翻译工作环境还包括协同翻译平台(如云翻译服务平台),以供多名在空间上分散的用户(如译者)被组织起来共同完成一项翻译任务。计算机辅助翻译系统提供的译后编辑环境是固定的,但不同用户对译后编辑的辅助工具、辅助方式和界面风格等有不同需求,协同翻译系统应能根据用户的交互行为和翻译状态,预测不同用户在不同翻译阶段对译后编辑辅助模式的不同需求,将系统的辅助适时地提供给用户(叶娜等,2012: 7)。这就要求协同翻译平台对各种译后编辑工具(软件)具有兼容性。内容(原文)管理系统、质量检测系统、术语管理系统、桌面排版系统等也需要置入或融进集成译后编辑工作环境,或通过应用程序接口把机器翻译连接到翻译(内容)管理系统。功能多容易显得比较臃肿,集成翻译工作环境主要针对大型项目(任务)而言的,并且译后编辑的主要目的是为了扩散信息。TAUS(2013)总结过翻译技术的发展趋势,即从桌面到服务器再到云端,从许可认证到职业服务再到软件即服务(SaaS)以及与内容管理系统整合。译后编辑者(集成)翻译工作环境的研发与研究也要与时俱进,充分考虑这些技术趋势。

 

(二) 特定机器翻译系统

 

机器翻译有基于规则的、有基于统计的、也有混合引擎的,机器翻译系统的研发主要是机器翻译领域专家的事,但哪种机器翻译最适合做哪类译后编辑实践,译后编辑者最有发言权。译后编辑者通过实践可将结果反馈给机译系统,系统应再对这种反馈信息加以充分利用,不断完善自身的翻译知识体系,提高翻译性能,避免重复生成同样的错误。机译系统进行自我完善的途径有两种: 一是基于自动译后编辑的方法,即从反馈中学习翻译知识,建立一个译后编辑模型,自动发现系统产生的译文中存在的错误,并对译文进行修改(系统的翻译引擎并不发生改变); 其次是基于在线学习的方法,批量处理用户的反馈信息,不断从中学习,实时调整系统的机器翻译引擎的各项参数,使其得到实时优化(叶娜等,2012: 5)。机译系统的自我完善也是人机互动的重要表现。译后编辑的反馈可以帮助训练(统计)机译系统,受训的机译系统可望与译后编辑实践形成良性循环。定制化机译系统可以大大提高机器翻译的准确性,可以广泛应用在特定领域或行业中,以减少译后编辑的工作量。只要相关语料充分,实时定制基于统计的机译系统也是可能的,这尤其适用于特定领域中的大宗翻译项目。开源技术不需要建立与支持原始引擎,可望为机译系统的定制化服务提供很大的便利。还有众多在线免费的机译系统,也可为译后编辑提供原始机译产出,当然也包括收费的商业化机译系统。然而,为达到最佳效果与体验,到底用什么样的机译系统进行译后编辑实践或教学取决于很多因素,如系统性能、原文特征、语言对、译后编辑者的偏好、译后编辑工作环境等,不能一概而论。语言服务提供商或相关个体要找到适合自己的机译系统。

 

(三) 支持多格式文件的机器翻译

 

当前的通用机器翻译系统,如谷歌翻译、百度翻译、微软必应等,都只能处理纯文本(TXT)文件,这为机器翻译的译后编辑带来了很大的不便。译后编辑人员既需要识别和修改机器翻译产生的语义和语法错误,还需要添加多格式文本中的字符标记符号。新一代处理多格式文件的机器翻译系统集成了多格式文件类型解析技术和机器翻译技术,在快速提供机器翻译译文的同时,还保留了原文件的标记符号等格式,使得译后编辑人员集中精力识别和修改机器翻译产出的语言问题。UTH国际开发的“芝麻秘语”便是这种机器翻译系统的典型代表。芝麻秘语是一款简便高效的机器翻译系统,“一款颠覆时代的翻译利器”,用户只需将文件拖拽到用户安装的桌面版芝麻秘语的界面中,便可在10-15秒内同时将多达5个文件翻译完毕,并可选择直接打开、下载或让系统将翻译后的文件发送至用户事先设定好的邮箱内。芝麻秘语可处理20种格式的文件,如DOCX,XLSX,PPTX,PDF等,翻译后的文件与源文件在格式上保持一致,便于译后编辑者以最低的成本与最快的速度完成译后编辑。这种支持多格式文件的机器翻译系统需要技术界与翻译界的共同关注,有望大大降低机器翻译的格式错误。此类机译系统若与译后编辑工具平台相结合,译后编辑的效率会更高。

 

(四) 译后编辑者的培养

 

译后编辑者的培养研究不管在国内还是国外都是一个较为薄弱的环节。尽管译后编辑在全球语言服务行业中扮演着重要角色,但国内外高校几乎没有把译后编辑作为独立课程进行设置的,部分高校在计算机辅助翻译课或其它相关课程(如本地化、机器翻译等)中对译后编辑会有所介绍,如香港中文大学开设的“机器翻译编辑技能”课程便涉及大量的译后编辑知识,也可认为是一门独立的译后编辑课。目前,TAUSSDL都提供译后编辑培训与认证服务,在各自的官方网站上也都有所介绍。TAUS网站上还有对译后编辑工具(Dynamic Quality Framework,DQF)以及一些最佳实践的介绍。SDL提供的译后编辑课程包括三大部分,即机器翻译与译后编辑的历史与发展历程、机器翻译技术与引擎创建、译后编辑(理解的PE和有效的PE)以及SDL Trados StudioSDL Be Global Baselines的使用,授课以预录的网络研讨会形式展开。在译后编辑者的培养方面,企业走在了高校前面,高校如何向企业学习,取长补短,是翻译(译后编辑)教育不得不考虑的。此外,译后编辑能力研究(构成要素、与翻译能力的区别与联系等)、译后编辑教学师资的培养、译后编辑课程设置与教学方法、译后编辑工具与机器翻译引擎的选择、译后编辑教学对象的确立、译后编辑最佳实践案例库的创建与维护、企业与高校的联合培养模式探索等都是译后编辑者培养研究的重要课题,相信在不久的将来会引起翻译教育界的重视。

 

(五) 产学研的深入合作

 

针对译后编辑研究而言,产学研紧密结合的似乎还不是很多,有待进一步拓展。这里的“产”主要指翻译产业或语言服务行业中的企业或其它相关机构,“学”主要指高校翻译教学或教育界,“研”则指译后编辑研究的科研群体,不管是在高校还是在企业或其它科研机构。推进产学研一体化已逐渐成为翻译教育界的共识,国内部分高校的MTI教育在这方面就做得有声有色,如北京大学、南开大学等。译后编辑若纳入到高校翻译教育界后,产学研的深入合作是必由之路,至于由谁先行则视情况而定。在高校,一般是研究先行,然后再进行教学培养,同时寻求校企合作。高校注重的是社会效益,企业(用人单位)注重的是经济效益,在翻译教育中如何解决两者之间的矛盾,刘和平(2014)曾提出过几条建议,包括实现资源互补共享、教学计划因地制宜(分别在高校与用人单位进行)、将真实的经典项目引入课堂、校企联合培养学生(如双导师制、定制化培养)等。这些建议对高校译后编辑者的培养同样适用,如高校完全可与TAUS、SDL、莱博智 (Lionbridge)等公司(机构)联合培养译后编辑人才,实现师资、资源与成果共享,力争取得双赢局面。北京翻译技术沙龙分别于2012年与2016年组织了两次以译后编辑为主题的活动,邀请了很多国内行业专家进行交流主讲,初步推动了业界与学界的沟通与合作。中国翻译协会翻译能力培训与评估中心(LSCAT)也开始把译后编辑纳入到培训范围,有望推动产学研的深入合作。

 

四、结语

 

机器翻译技术与翻译记忆技术是语言服务行业的两大支柱性技术,两者呈现出双峰并峙的局面。就目前而言,作为计算机辅助翻译的核心技术,翻译记忆在行业内运用得更加普及与成熟。随着人们对机器翻译期望值的降低以及海量翻译的持续增加,译后编辑的工作模式将被广泛认可与应用,获得业内人士的青睐,有望赶超翻译记忆的应用价值,成为语言服务企业的龙头服务模式。这并不否定两者的整合趋势,尤其是在集成翻译工作环境下,只是侧重点有所不同而已。国外的译后编辑研究始于20世纪八十年代中期,进入新千年后有更为迅速的发展,发表的论文数以百计,多集中在译后编辑概述、译后编辑评估研究、机器翻译错误识别与译后编辑工具研发、译后编辑研究的行业视角、译后编辑能力与译后编辑者的培养等焦点话题。译后编辑研究的发展趋势包括集成翻译工作环境的研发、特定机器翻译系统的研制与应用、译后编辑人才的培养以及产学研的深入合作等。国内译界的译后编辑研究始于新千年之后,当以魏长宏、张春柏(2007)发表的论文为标志,相对国外起步较晚。译后编辑在具体领域的应用研究(如跨境电商、专利翻译、新闻翻译等)在国内译界更是鲜有谈及。本研究通过总结译后编辑的研究现状,预测其趋势,以为学界提供参考。

 

基金项目:教育部人文社会科学青年基金项目“译后编辑与译后编辑能力研究”(15YJC740015); 对外经济贸易大学中央高校基本科研项目业务费专项资金资助(编号14YB16)。

 

作者简介

 

冯全功,博士,浙江大学外国语言文化与国际交流学院副教授,研究方向:《红楼梦》翻译、翻译修辞学、职业化翻译、生态翻译学。

 

崔启亮,博士,对外经济贸易大学英语学院副教授,研究方向: 软件本地化、计算机辅助翻译。

 

本文原载《上海翻译》2016年第6期,第67-74;89页,参考文献从略。本次推送已获作者授权,谨此致谢。如若引用,请以原载期刊为准;转发请注明“大民说英语”以及文章来源。

视频 小程序 ,轻点两下取消赞 在看 ,轻点两下取消在看

您可能也对以下帖子感兴趣

文章有问题?点此查看未经处理的缓存